iT邦幫忙

0

【實習心得】卓騰語言科技

  • 分享至 

  • xImage
  •  

  因為一直以來在學校裡接收到的東西都還是學術導向居多,對於業界到底怎麼應用 NLP 技術,讓它落地,更甚至是以此獲利都不慎了解。因此六月多的時候發現卓騰在招實習生的時候很快就決定要 apply 看看,也很幸運地被錄取了。有鑑於可能會有人對卓騰的實習生到底都在幹嘛感到好奇,拿到實習證明也需要撰寫心得,下面就跟大家分享一下實習過程中我個人的一些所見所感。

實習內容

  • 頻率:一週一次,一次約 3 個小時
  • 內容:
    • 理論:語言學基礎、語言學如何跟 computer science 結合
    • 實作:卓騰 NLP 相關產品使用教學
  • 需求條件:
    • 具有一定程式基礎
    • 修習過語言學相關課程
    • 學習過英文以外的外語
  • 需完成任務:
    • 通過中間考核
    • 應用卓騰產品完成 side project
    • 於公開平台撰寫實習心得
  • 薪水:無,但可以免費使用卓騰產品一年
  • 註:跟一般的實習比起來可能更像是學校請了業師來指導的感覺。不會實際參與公司業務(所以沒有 pay),但會告訴你很多業界做事的眉眉角角,以及如何把理論應用到現實當中。除此之外最重要的是可以累積一次 side project 的經驗,並且不會是孤軍奮戰,有能夠諮詢幫忙的人。(如果未來想往工程師發展的話,side project 會是履歷當中很重要的一環)

實習心得

  在卓騰的實習經驗中,最深刻感受到的是批判性思考的重要性。「批判性思考」其實是大家都知道重要的東西,但知行合一卻不是那麼簡單的一件事。當然可能也會有人覺得不過就是 NLP 而已,處理資料跟訓練模型哪需要什麼批判性思考?但如果真的淪為麻木訓練模型的工具,那大概很難再進步下去了。
  在接觸各種理論的過程中,我們往往因為對這些理論不熟悉而只追求趕快搞懂他們的內容。模型的原理是什麼?公式是怎麼計算的?程式碼怎麼跑?好不容易弄清楚脈絡之後可能就忘記回來思考更根本的問題,那就是這些模型跟統計方法真的可以用來表達語言或是學習語言嗎?在卓騰接觸到以前未曾接觸過的觀點就是用連續型數值來表達語言的不合理性。「因為每個字符對電腦來說都只是一串編碼,並不具有其他意義,所以要把他們轉換成數值、向量來幫助計算」看起來雖然合理,但其實似乎與語言的本質相悖。每一個字或詞之間並不會像 1 跟 2 中間一樣可以有無限的數值,既然如此,追求讓機器像人一樣學習語言的我們,是否使用了錯誤的方法呢?第一次聽到 Peter 分享這個觀點時就覺得很有趣,這是我沒有思考過的一種角度。即便我還沒有辦法確定到底什麼方法才是對 NLP 來說最合適的,能認知到一種新的角度對我來說已經是很大的收穫了。這也提醒了我在吸收知識的同時,反芻他們的重要性。
  身為一個主修語言學未來又想從事 NLP 相關工作的學生,我一直以來都在尋找如何讓語言學的價值體現在這個產業中的方法,也總是在思考要怎麼讓他人理解這樣的價值。很高興在卓騰能夠學到更多透過語言學角度的思考來看 NLP 以及實踐的方法,我想這對於任何追求多元思考和看事情角度的人來說也會是很適合的機會。


圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言